home *** CD-ROM | disk | FTP | other *** search
/ Almathera Ten Pack 2: CDPD 1 / Almathera Ten on Ten - Disc 2: CDPD 1.iso / pd / 051-075 / 051 / bison / closure.c < prev    next >
C/C++ Source or Header  |  1995-03-13  |  8KB  |  385 lines

  1. /* Subroutines for bison, copyright (C) 1984 Bob Corbett and Richard Stallman
  2.  
  3.    Permission is granted to anyone to make or distribute verbatim copies of this program
  4.    provided that the copyright notice and this permission notice are preserved;
  5.    and provided that the recipient is not asked to waive or limit his right to
  6.    redistribute copies as permitted by this permission notice;
  7.    and provided that anyone possessing an executable copy
  8.    is granted access to copy the source code, in machine-readable form,
  9.    in some reasonable manner.
  10.  
  11.    Permission is granted to distribute derived works or enhanced versions of
  12.    this program under the above conditions with the additional condition
  13.    that the entire derivative or enhanced work
  14.    must be covered by a permission notice identical to this one.
  15.  
  16.    Anything distributed as part of a package containing portions derived
  17.    from this program, which cannot in current practice perform its function usefully
  18.    in the absense of what was derived directly from this program,
  19.    is to be considered as forming, together with the latter,
  20.    a single work derived from this program,
  21.    which must be entirely covered by a permission notice identical to this one
  22.    in order for distribution of the package to be permitted.
  23.  
  24.  In other words, you are welcome to use, share and improve this program.
  25.  You are forbidden to forbid anyone else to use, share and improve
  26.  what you give them.   Help stamp out software-hoarding!  */
  27.  
  28. /* subroutines of file LR0.c.
  29.  
  30. Entry points:
  31.  
  32.   closure (items, n)
  33.  
  34. Given a vector of item numbers items, of length n,
  35. set up ruleset and itemset to indicate what rules could be run
  36. and which items could be accepted when those items are the active ones.
  37.  
  38. ruleset contains a bit for each rule.  closure sets the bits
  39. for all rules which could potentially describe the next input to be read.
  40.  
  41. itemset is a vector of item numbers; itemsetend points to just beyond the end
  42.  of the part of it that is significant.
  43. closure places there the indices of all items which represent units of
  44. input that could arrive next.
  45.  
  46.   initialize_closure (n)
  47.  
  48. Allocates the itemset and ruleset vectors,
  49. and precomputes useful data so that closure can be called.
  50. n is the number of elements to allocate for itemset.
  51.  
  52.   finalize_closure ()
  53.  
  54. Frees itemset, ruleset and internal data.
  55.  
  56. */
  57.  
  58. #include <stdio.h>
  59. #include "machine.h"
  60. #include "new.h"
  61. #include "gram.h"
  62.  
  63.  
  64. extern short **derives;
  65.  
  66.  
  67. short *itemset;
  68. short *itemsetend;
  69. static unsigned *ruleset;
  70.  
  71. /* internal data.  See comments before set_fderives and set_firsts.  */
  72. static unsigned *fderives;
  73. static unsigned *firsts;
  74.  
  75. /* number of words required to hold a bit for each rule */
  76. static int rulesetsize;
  77.  
  78. /* number of words required to hold a bit for each variable */
  79. static int varsetsize;
  80.  
  81.  
  82.  
  83. initialize_closure(n)
  84. int n;
  85. {
  86.   itemset = NEW2(n, short);
  87.  
  88.   rulesetsize = WORDSIZE(nrules + 1);
  89.   ruleset = NEW2(rulesetsize, unsigned);
  90.  
  91.   set_fderives();
  92. }
  93.  
  94.  
  95.  
  96. /* set fderives to an nvars by nrules matrix of bits
  97.    indicating which rules can help derive the beginning of the data
  98.    for each nonterminal.  For example, if symbol 5 can be derived as
  99.    the sequence of symbols 8 3 20, and one of the rules for deriving
  100.    symbol 8 is rule 4, then the [5 - ntokens, 4] bit in fderives is set.  */
  101.  
  102. set_fderives()
  103. {
  104.   register unsigned *rrow;
  105.   register unsigned *vrow;
  106.   register int j;
  107.   register unsigned mask;
  108.   register unsigned cword;
  109.   register short *rp;
  110.  
  111.   int ruleno;
  112.   int i;
  113.  
  114.   fderives = NEW2(nvars * rulesetsize, unsigned) - ntokens * rulesetsize;
  115.  
  116.   set_firsts();
  117.  
  118.   rrow = fderives + ntokens * rulesetsize;
  119.  
  120.   for (i = ntokens; i < nsyms; i++)
  121.     {
  122.       vrow = firsts + ((i - ntokens) * varsetsize);
  123.       cword = *vrow++;
  124.       mask = 1;
  125.       for (j = ntokens; j < nsyms; j++)
  126.     {
  127.       if (cword & mask)
  128.         {
  129.           rp = derives[j];
  130.           while ((ruleno = *rp++) > 0)
  131.         {
  132.           SETBIT(rrow, ruleno);
  133.         }
  134.         }
  135.  
  136.       mask <<= 1;
  137.       if (mask == 0)
  138.         {
  139.           cword = *vrow++;
  140.           mask = 1;
  141.         }
  142.     }
  143.  
  144.       vrow += varsetsize;
  145.       rrow += rulesetsize;
  146.     }
  147.  
  148. #ifdef    DEBUG
  149.   print_fderives();
  150. #endif
  151.  
  152.   FREE(firsts);
  153. }
  154.  
  155.  
  156.  
  157. /* set firsts to be an nvars by nvars bit matrix indicating which items
  158.    can represent the beginning of the input corresponding to which other items.
  159.    For example, if some rule expands symbol 5 into the sequence of symbols 8 3 20,
  160.    the symbol 8 can be the beginning of the data for symbol 5,
  161.    so the bit [8 - ntokens, 5 - ntokens] in firsts is set. */
  162.  
  163. set_firsts()
  164. {
  165.   register unsigned *row;
  166.   register int done;
  167.   register int symbol;
  168.   register short *sp;
  169.   register int rowsize;
  170.  
  171.   int i;
  172.  
  173.   varsetsize = rowsize = WORDSIZE(nvars);
  174.  
  175.   firsts = NEW2(nvars * rowsize, unsigned);
  176.  
  177.   row = firsts;
  178.   for (i = ntokens; i < nsyms; i++)
  179.     {
  180.       sp = derives[i];
  181.       while (*sp >= 0)
  182.     {
  183.       symbol = ritem[rrhs[*sp++]];
  184.       if (ISVAR(symbol))
  185.         {
  186.           symbol -= ntokens;
  187.           SETBIT(row, symbol);
  188.         }
  189.     }
  190.  
  191.       row += rowsize;
  192.     }
  193.  
  194.   RTC(firsts, nvars);
  195.  
  196. #ifdef    DEBUG
  197.   print_firsts();
  198. #endif
  199. }
  200.  
  201.  
  202.  
  203. closure(core, n)
  204. short *core;
  205. int n;
  206. {
  207.   register int ruleno;
  208.   register unsigned word;
  209.   register unsigned mask;
  210.   register short *csp;
  211.   register unsigned *dsp;
  212.   register unsigned *rsp;
  213.  
  214.   short *csend;
  215.   unsigned *rsend;
  216.   int symbol;
  217.   int itemno;
  218.  
  219.   rsp = ruleset;
  220.   rsend = ruleset + rulesetsize;
  221.   csend = core + n;
  222.  
  223.   if (n == 0)
  224.     {
  225.       dsp = fderives + start_symbol * rulesetsize;
  226.       while (rsp < rsend)
  227.     *rsp++ = *dsp++;
  228.     }
  229.   else
  230.     {
  231.       while (rsp < rsend)
  232.     *rsp++ = 0;
  233.  
  234.       csp = core;
  235.       while (csp < csend)
  236.     {
  237.       symbol = ritem[*csp++];
  238.       if (ISVAR(symbol))
  239.         {
  240.           dsp = fderives + symbol * rulesetsize;
  241.           rsp = ruleset;
  242.           while (rsp < rsend)
  243.         *rsp++ |= *dsp++;
  244.         }
  245.     }
  246.     }
  247.  
  248.   ruleno = 0;
  249.   itemsetend = itemset;
  250.   csp = core;
  251.   rsp = ruleset;
  252.   while (rsp < rsend)
  253.     {
  254.       word = *rsp++;
  255.       if (word == 0)
  256.     {
  257.       ruleno += BITS_PER_WORD;
  258.     }
  259.       else
  260.     {
  261.       mask = 1;
  262.       while (mask)
  263.         {
  264.           if (word & mask)
  265.         {
  266.           itemno = rrhs[ruleno];
  267.           while (csp < csend && *csp < itemno)
  268.             *itemsetend++ = *csp++;
  269.           *itemsetend++ = itemno;
  270.         }
  271.  
  272.           mask <<= 1;
  273.           ruleno++;
  274.         }
  275.     }
  276.     }
  277.  
  278.   while (csp < csend)
  279.     *itemsetend++ = *csp++;
  280.  
  281. #ifdef    DEBUG
  282.   print_closure(n);
  283. #endif
  284. }
  285.  
  286.  
  287.  
  288. finalize_closure()
  289. {
  290.   FREE(itemset);
  291.   FREE(ruleset);
  292.   FREE(fderives + ntokens * rulesetsize);
  293. }
  294.  
  295.  
  296.  
  297. #ifdef    DEBUG
  298.  
  299. print_closure(n)
  300. int n;
  301. {
  302.   register short *isp;
  303.  
  304.   printf("\n\nn = %d\n\n", n);
  305.   for (isp = itemset; isp < itemsetend; isp++)
  306.     printf("   %d\n", *isp);
  307. }
  308.  
  309.  
  310.  
  311. print_firsts()
  312. {
  313.   register int i;
  314.   register int j;
  315.   register unsigned *rowp;
  316.   register unsigned cword;
  317.   register unsigned mask;
  318.  
  319.   extern char **tags;
  320.  
  321.   printf("\n\n\nFIRSTS\n\n");
  322.  
  323.   for (i = ntokens; i < nsyms; i++)
  324.     {
  325.       printf("\n\n%s firsts\n\n", tags[i]);
  326.  
  327.       rowp = firsts + ((i - ntokens) * vrowsize);
  328.  
  329.       cword = *rowp++;
  330.       mask = 1;
  331.       for (j = 0; j < nsyms; j++)
  332.     {
  333.       if (cword & mask)
  334.         printf("   %s\n", tags[j + ntokens]);
  335.  
  336.       mask <<= 1;
  337.  
  338.       if (mask == 0)
  339.         {
  340.           cword = *rowp++;
  341.           mask = 1;
  342.         }
  343.     }
  344.     }
  345. }
  346.  
  347.  
  348.  
  349. print_fderives()
  350. {
  351.   register int i;
  352.   register int j;
  353.   register unsigned *rp;
  354.   register unsigned cword;
  355.   register unsigned mask;
  356.  
  357.   extern char **tags;
  358.  
  359.   printf("\n\n\nFDERIVES\n");
  360.  
  361.   for (i = ntokens; i < nsyms; i++)
  362.     {
  363.       printf("\n\n%s derives\n\n", tags[i]);
  364.       rp = fderives + i * rrowsize;
  365.       cword = *rp++;
  366.       mask = 1;
  367.       for (j = 0; j <= nrules; j++)
  368.         {
  369.       if (cword & mask)
  370.         printf("   %d\n", j);
  371.  
  372.       mask <<= 1;
  373.       if (mask == 0)
  374.         {
  375.           cword = *rp++;
  376.           mask = 1;
  377.         }
  378.     }
  379.     }
  380.  
  381.   fflush(stdout);
  382. }
  383.  
  384. #endif
  385.